Distribución uniforme

ver: Tutorial

\begin{equation} F(x)=P(X<x),\qquad\text{c.d.f} \end{equation}

In [6]:
punif(0.3,0,1) #P(x<=x)


Out[6]:
[1] 0.3
\begin{equation} f(x)=F'(x),\qquad \text{p.d.f} \end{equation}

In [9]:
dunif(0.3,0,1)


Out[9]:
[1] 1

In [12]:
curve(dunif, from = -1, to = 2)


Simular n=10000 valores


In [22]:
u <- runif(10000,0,1)
\begin{equation} E[x]=\int_\infty^\infty x f(x)\,dx \end{equation}

In [29]:
mean(u)


Out[29]:
[1] 0.4984739
\begin{equation} V[x]=\int_\infty^\infty (x-E[x])^2 f(x)\,dx=E[x^2]-E[x]^2 \end{equation}

In [78]:
1/12


Out[78]:
[1] 0.08333333

In [30]:
var(u)


Out[30]:
[1] 0.08259972
\begin{equation} \sigma=\sqrt{V[x]} \end{equation}

In [31]:
sd(u)


Out[31]:
[1] 0.2874017

Distribución binomial

Para una distribución discreta, la probabilidad de tener un valor $X=k$ es \begin{align} P(X=k)=f(k;\text{parameters}) \end{align} En particular la distribución minomial es \begin{align} P(X=k)=B(k;n,p)=\begin{pmatrix} n\\ k\\ \end{pmatrix}p^k (1-p)^{n-k}\,, \end{align} donde $B(k;n,p)$ es la p.d.f


In [33]:
n <- 8
p <- 0.15
barplot(dbinom(0:n,n,p), names.arg=0:n)


Ejemplo: Un exámen de escogencia múltiple tiene $n=10$ preguntas con 4 escogencias cada una. Si un estudiante adivina cada una de las preguntas, ¿cual es la posibilidad que acierte $k$ preguntas?

En este caso $p=1/4$ y \begin{align} P(X=k)=B(k;10,1/4)=\begin{pmatrix} 10\\ k\\ \end{pmatrix}\left(\frac{1}{4}\right)^k \left(1-\frac{1}{4}\right)^{10-k} \end{align}


In [80]:
n <- 10
p <- 0.25
barplot(dbinom(0:n,n,p), names.arg=0:n)



In [81]:
dbinom(2,n,p)


Out[81]:
[1] 0.2815676

En el caso discreto: \begin{equation} F(x;n,p)=P(X\le x),\qquad\text{c.d.f} \end{equation} La probabilidad de que un estudiante tenga al menos dos preguntas correctas, \begin{align} P(X\ge 2)=1-P(X\le 1) \end{align}


In [41]:
1-pbinom(1,n,p)


Out[41]:
[1] 0.7559748

Ejemplo: En un bosque de 100 árboles, cada árbol tiene un 10% de posibilidades de estar infectado por una enfermedad de las raices independientemente de los otros árboles. ¿Cual es la probabilidad de que más de 5 árboles esten infectados?


In [43]:
n <- 100
p <- 0.10
1-pbinom(5,n,p)


Out[43]:
[1] 0.9424231

Se puede usar rbinom para simular la probabilidad $P(X>5)$ basados en 10,000 repeticiones:


In [66]:
i <- 10000
simlist <- rbinom(i,n,p)
sum(simlist>5)/i


Out[66]:
[1] 0.9421

Propiedades

Normalización \begin{align} \sum_{k=0}^n B(k;n,p)=\left[p-(1-p)\right]^n=1 \end{align}

\begin{align} E[x]=\sum_{k=0}^n k B(k;n,p)=np \end{align}

In [67]:
n*p


Out[67]:
[1] 10

In [68]:
mean(simlist)


Out[68]:
[1] 9.9673
\begin{equation} V[k]=E[k^2]-E[k]^2=np(1-p) \end{equation}

In [74]:
n*p*(1.-p)


Out[74]:
[1] 9

In [70]:
var(simlist)


Out[70]:
[1] 8.904521
\begin{equation} \sigma=\sqrt{V[x]} \end{equation}

In [71]:
sd(simlist)


Out[71]:
[1] 2.984044

Precisión \begin{align}\frac{\sigma}{E[x]}\end{align}


In [77]:
sqrt(n*p*(1.-p))/(n*p)


Out[77]:
[1] 0.3

In [73]:
sd(simlist)/mean(simlist)


Out[73]:
[1] 0.2993834

Ejemplo: Cual es la probabilidad de obtener 450 caras de 1000 lanzamientos de una moneda?


In [1]:
n <- 1000
p <- 0.5
pbinom(450,n,p)


Out[1]:
[1] 0.000865268

In [4]:
n <- 1000
p <- 0.5
barplot(dbinom(400:600,n,p), names.arg=400:600)


Distribución de Poisson

Distribución de Poisson para nacimientos por día en Colombia en 2013


In [19]:
n <- 1300
l <- 1179
barplot(dpois(1050:n,l), names.arg=1050:n)


La probabilidad de que haya 1180 nacimientos mañana en Colombia es


In [20]:
sqrt(l)


Out[20]:
[1] 34.33657

In [11]:
dpois(1180,l)


Out[11]:
[1] 0.01160792

La probabilidad de que haya 1000 nacimientos mañana en Colombia es


In [12]:
dpois(1000,l)


Out[12]:
[1] 7.515653e-09

Muertos por brigrada


In [15]:
n <- 5
l <- 0.61
barplot(dpois(0:n,l), names.arg=0:n)



In [16]:
barplot(dpois(0:n,l)*200, names.arg=0:n)



In [17]:
dpois(0:n,l)*200


Out[17]:
[1] 108.67017381  66.28880603  20.21808584   4.11101079   0.62692915
[6]   0.07648536

Ditribución Gaussiana (Normal)

Parámetros por defecto: $\mu=0$ y $\sigma=1$


In [10]:
curve(dnorm, from = -4, to = 4)



In [11]:
x   <- seq(-4,4,length=1000)
plot(x,dnorm(x,mean=0, sd=1), type="l", lwd=1)


Las probabilidades de una variable aleatoria con una distribución normal este dentro de uno, dos y tres desviaciones de la media puede calcularse para $x=1,2,3$ con $\mu=0$ y $\sigma=1$


In [12]:
pnorm(1)-pnorm(-1)


Out[12]:
[1] 0.6826895

In [13]:
pnorm(2)-pnorm(-2)


Out[13]:
[1] 0.9544997

Evidencia:


In [14]:
pnorm(3)-pnorm(-3)


Out[14]:
[1] 0.9973002

Descubrimiento


In [66]:
1-(pnorm(5)-pnorm(-5))


Out[66]:
[1] 5.733031e-07

Ejemplo: Pesos de recien nacidos


In [21]:
x   <- seq(1500,5300,length=1000)
mu <- 3400
sigma <- 570
plot(x,dnorm(x,mu, sigma), type="l", lwd=1)


¿Cual es la probabilidad de que nazca más pesado que 4 Kg?


In [22]:
1-pnorm(4000,mu, sigma)


Out[22]:
[1] 0.1462549

In [23]:
1-pnorm( (4000-mu)/sigma)


Out[23]:
[1] 0.1462549

Se han registrado nacimiemtos por parto natural de bebes de 6.11 Kg. ¿Cual es la proababilidad?


In [27]:
1.-pnorm(6000,mu, sigma)


Out[27]:
[1] 2.540641e-06

In [28]:
1.-pnorm(7000,mu, sigma)


Out[28]:
[1] 1.343928e-10

A 2002 han nacido en la tierra $106\;456\;367\;669$ personas (Fuente: Estimaciones del Population Reference Bureau. http://www.prb.org/). ¿Cual es el niño más pesado que ha nacido hasta entonces?


In [29]:
1/106456367669


Out[29]:
[1] 9.39352e-12

In [54]:
1.-pnorm(7228,mu, sigma)


Out[54]:
[1] 9.352519e-12

Límite binomial


In [55]:
n <- 4
p <- 0.1
barplot(dbinom(0:n,n,p), names.arg=0:n)



In [58]:
n <- 25
nmax <-10
p <- 0.1
barplot(dbinom(0:nmax,n,p), names.arg=0:nmax)



In [60]:
n <- 500
nmin=25
nmax <-80
p <- 0.1
barplot(dbinom(nmin:nmax,n,p), names.arg=nmin:nmax)


Probabilidad de obtener entre 90 y 110 cuatros en 600 tiradas de un dado:


In [61]:
mu <- 100  
sigma <- sqrt(500/6)
pnorm(110,mu,sigma)-pnorm(90,mu,sigma)


Out[61]:
[1] 0.7266783

In [65]:
pnorm((110-mu)/sigma)-pnorm((90-mu)/sigma)


Out[65]:
[1] 0.7266783

In [46]:
#\left(\right)
#\begin{align}\end{align}